測回歸模型:線性迴歸模型
Call:
lm(formula = 總價元 ~ ., data = train_data)
Residuals:
Min 1Q Median 3Q Max
-950855418 -2411875 -232911 2119695 1247816505
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 3.808e+06 2.833e+05 13.441 < 2e-16 ***
土地移轉總面積平方公尺 2.123e+04 2.862e+02 74.166 < 2e-16 ***
建物移轉總面積平方公尺 8.713e+04 2.702e+02 322.491 < 2e-16 ***
建物現況格局.房 1.500e+06 2.643e+04 56.761 < 2e-16 ***
建物現況格局.廳 -4.648e+05 7.345e+04 -6.328 2.49e-10 ***
車位移轉總面積平方公尺 -1.367e+04 1.801e+03 -7.588 3.29e-14 ***
車位總價元 -3.206e-01 4.638e-02 -6.911 4.84e-12 ***
主建物面積 -6.309e+04 3.215e+02 -196.232 < 2e-16 ***
附屬建物面積 -1.035e+05 6.235e+03 -16.607 < 2e-16 ***
電梯 3.466e+06 1.184e+05 29.280 < 2e-16 ***
建物型態_透天厝 2.322e+06 1.718e+05 13.512 < 2e-16 ***
陽台面積 1.402e+05 6.426e+03 21.810 < 2e-16 ***
建物現況格局.隔間 -8.233e+06 3.044e+05 -27.048 < 2e-16 ***
建物型態_住宅大樓.11層含以上有電梯. 8.128e+05 1.171e+05 6.938 4.00e-12 ***
建物型態_工廠 -4.430e+06 1.459e+06 -3.036 0.0024 **
建物型態_店面.店鋪. 1.274e+07 3.975e+05 32.059 < 2e-16 ***
建物型態_廠辦 -3.084e+07 1.029e+06 -29.984 < 2e-16 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 13370000 on 82399 degrees of freedom
Multiple R-squared: 0.7995, Adjusted R-squared: 0.7995
F-statistic: 2.053e+04 on 16 and 82399 DF, p-value: < 2.2e-16
線性迴歸模型:
均方誤差 (MSE): 1.834052e+14
均方根誤差 (RMSE): 13542717
R平方的平方根 (R): 0.2263215
測回歸模型:隨機森林模型,因為本機跑不動這部分,所以改用colab跑出數值
隨機森林模型預測結果:
均方根誤差 (RMSE): 5601936
R平方 (R-squared): 0.807212
測回歸模型:AdaBoost,因為本機跑不動這部分,所以改用colab跑出數值
AdaBoost模型預測結果:
均方誤差 (MSE): 1.120157e+14
均方根誤差 (RMSE): 10583748
R平方 (R-squared): 0.3118508
測回歸模型:決策樹回歸模型,因為本機跑不動這部分,所以改用colab跑出數值
決策樹回歸模型預測結果:
均方誤差 (MSE): 1.271186e+14
均方根誤差 (RMSE): 11274691
R平方 (R-squared): 0.2190686
測回歸模型:XGBoost回歸模型,因為本機跑不動這部分,所以改用colab跑出數值
XGBoost回歸模型預測結果:
均方誤差 (MSE): 2.813591e+14
均方根誤差 (RMSE): 16773764
R平方 (R-squared): -0.7284812
結論 RMSE越低,預測越準確;R平方越高,模型對變異性的解釋能力越強。 隨機森林模型具有最低的均方根誤差 (RMSE) 和最高的R平方,這表示它在預測方面表現最佳。 AdaBoost模型的表現次之,其RMSE較低,但R平方較低,預測相對較差。 線性迴歸模型和決策樹迴歸模型的表現相對較差,它們的RMSE相對高,而R平方的平方根 (R) 也較低。這表示這兩種模型對於數據的預測能力有限。 綜合考慮,隨機森林模型是我們的最佳選擇,因為它在預測房價方面表現最佳。不過,可能需要進一步優化模型。 P.S測回歸模型:SVM,由於在colab上跑太久未有結果。
[1] "均方誤差 (RMSE): 11952930.9495704"
[1] "R平方 (R-squared): 0.412332498755922"